通过在图像传感器设计中加入可编程的兴趣区域(ROI)读数来提高嵌入式视觉系统的能量效率的巨大范围。在这项工作中,我们研究如何利用ROI可编程性,以便通过预期ROI将位于未来帧中的位置并在该区域之外切换像素来进行跟踪应用程序。我们将ROI预测的该过程和对应的传感器配置称为自适应限制。我们的自适应数据采样算法包括对象检测器和ROI预测器(卡尔曼滤波器),其结合地操作以优化视觉管道的能量效率,其结束任务是对象跟踪。为了进一步促进现实生活中的自适应算法的实施,我们选择候选算法并将其映射到FPGA上。利用Xilinx血管AI工具,我们设计并加速了基于YOLO对象探测器的自适应数据采样算法。为了进一步改进算法的部署后,我们在OTB100和LASOT数据集中评估了几个竞争的基线。我们发现将ECO跟踪器与Kalman滤波器耦合,在OTB100和Lasot Datasets上具有0.4568和0.3471的竞争性AUC分数。此外,该算法的功率效率与另一个基线优于相同的情况,并且在几个外部的情况下。基于ECO的算法在两个数据集上发生大约4W的功耗,而基于YOLO的方法需要大约6 W的功耗(根据我们的功耗模型)。在精度延迟权衡方面,基于ECO的算法在管理达到竞争跟踪精度的同时提供近实时性能(19.23 FPS)。
translated by 谷歌翻译
合成孔径声纳(SAS)图像分辨率受波形带宽和阵列几何结构的约束。具体地,波形带宽确定点扩展函数(PSF),其将点散射体的位置模糊在场景中。理论上,用场景PSF解码重建的SAS图像恢复散射体的原始分布,并产生更清晰的重建。然而,去卷积是一种对噪声高度敏感的不良操作。在这项工作中,我们利用隐式的神经表示(inrs),被证明是自然图像空间的强前沿,以解构SAS图像。重要的是,我们的方法不需要培训数据,因为我们通过以自我监督的方式进行分析逐个合金优化来执行Deconvolution。我们验证了我们在使用点散射模型创建的模拟SAS数据的方法和用空内圆形SA捕获的真实数据。这项工作是应用SAS图像解卷积的神经网络的重要第一步。
translated by 谷歌翻译
Covid-19大流行导致了前所未有的全球公共卫生危机。鉴于其固有的性质,建议社会疏散措施作为遏制这种大流行传播的主要策略。因此,识别违反这些协议的情况,对削减疾病的传播并促进可持续生活方式具有影响。本文提出了一种基于电脑视觉的基于计算机视觉的系统,分析了CCTV镜头,为Covid-19传播提供了威胁水平评估。该系统努力捕获跨越多个帧的CCTV镜头的信息内容,以识别各个帧的各种违反社会偏移协议的实例,以及跨空间的识别,以及组行为的识别。该功能主要是通过利用基于时间图的基础结构来实现CCTV镜头的信息和对全能解释图的策略并量化给定场景的威胁级别的策略。在一系列场景中测试并验证各个组件,并针对人类专家意见进行了完整的系统。结果反映了威胁水平对人,其物理接近,相互作用,防护服和群体动力学的依赖。系统性能的准确性为76%,从而在城市进行了可部署的威胁监控系统,以允许社会中的正常和可持续性。
translated by 谷歌翻译
内在图像分解是生成图像的成分的打开问题。从单个图像产生反射率和阴影是一个具体的任务,特别是当没有地面真相时。缺乏无监督的学习方法,用于使用单个图像将图像分解成反射率和阴影。我们提出了一种神经网络架构,其能够使用从图像导出的基于物理的参数进行这种分解。通过实验结果,我们展示了(a)所提出的方法优于现有的基于深度学习的IID技术和(b)衍生参数显着提高疗效。我们得出结论,对结果(数值和示例图像)的仔细分析,显示了几个途径以改进。
translated by 谷歌翻译